iT邦幫忙

2024 iThome 鐵人賽

DAY 2
0
Python

30天挑戰之高中生專題-從資料科學到生成式AI系列 第 2

資料科學介紹-資料到智慧,分析的過程

  • 分享至 

  • xImage
  •  

圖文版:https://codinglu.tw/2024/07/week-1-introduction-to-data-science-python-ai-data-science/

人工智慧介紹-什麼是人工智慧、機器學習、深度學習和生成式學習,什麼是資料科學

資料科學

資料、資訊、知識與智慧

可以先了解一下,「資料」、「資訊」、「知識」和「智慧」四者之間的差別。

  • 資料是未經處理的事實或數字,它們是零散的、沒有上下文的原始數據。例如:搜集每天天氣
  • 資訊是對「資料」進行整理和處理後的結果,它通常包含了上下文或結構,使數據變得有意義。裡如:將資料計算出平均氣溫
  • 知識是從「資訊」中提煉出的理解或洞見,是對資訊的解釋、理解和應用。例如:知道對應的氣溫要穿什麼衣服;例如經過大量數據分析後,每個禮拜運動三次、每次心跳130以上,是曾經的健康指標
  • 智慧是運用「知識」作出明智決定的能力,它涉及到批判性思維、經驗和判斷力。例如:對知識做出洞見,比如29度,會帶著陽傘遮陽。

而資料科學就是嘗試將資料轉化成智慧的科學方式。其中過程可參考以下模式:

資料科學的過程

找到感興趣的主題→取得相關資料→進行資料前處理與清洗得到資訊→進行探索性分析→利用人工智慧(選擇適當的方式或模型)進行資料之間的相關性與預測→畫出資料並給予解釋→作出決策

而數據再進行分析的時候可以分成「描述性分析」、「診斷性分析」、「預測性分析」、「指示性分析」與「自動性分析」:

  • 描述性分析-發生了什麼?可以從數據檢視環境發生過什麼事情,並透過資料視覺化進行敘述。例如台灣年降雨量分析:
    • 歷年在暑假的降雨量最多。

      Untitled

    • 一個月最多下900毫米,2024年7月25日一天降雨量550毫米。

      Untitled

Untitled

總結來說,資料科學幫助我們從理解過去到計劃未來,這五個層次的數據分析各有其價值。從事後諸葛到洞燭先機,難度也從簡單到複雜。

Untitled


上一篇
前言
下一篇
Series與Dataframe - 以世界高山為例
系列文
30天挑戰之高中生專題-從資料科學到生成式AI3
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言